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Résumé. Nous présentons dans ce papier des approches de fusion d'informa- 
tions haut niveau applicables pour des données numériques ou des données sym- 
boliques. Nous étudions l'intérêt des telles approches particulièrement pour la 
fusion de classifieurs. Une étude comparative est présentée dans le cadre de la 
caractérisation des fonds marins à partir d'images sonar. Reconnaître le type de 
sédiments sur des images sonar est un problème difficile en soi en partie à cause 
de la complexité des données. Nous comparons les approches de fusion d'infor- 
mations haut niveau et montrons le gain obtenu. 

1 Introduction 

La fusion d'informations est apparue afin de gérer des quantités très importantes de données 
multisources dans le domaine militaire. Depuis quelques années des méthodes de fusion ont 
été adaptées et développées pour des applications en traitement du signal. Plusieurs sens sont 
donnés à la fusion d'informations, nous reprenons ici la définition proposée par (Bloch 2003) : 
La fusion d'informations consiste à combiner des informations issues de plusieurs sources afin 
d'aider à la prise de décision. 

Nous ne cherchons pas ici à réduire les redondances contenues dans les informations issues 
de plusieurs sources, mais au contraire à en tenir compte afin d'améliorer la prise de décision. 
De même nous cherchons à modéliser au mieux les différentes imperfections des données 
(imprécisions, incertitudes, conflit, ambiguïté, incomplétude, fiabilité des sources, ...) non pas 
pour les supprimer, mais encore pour l'aide à la décision. 

Différents niveaux de fusion ont été proposé dans la littérature. Ce qui est communément 
retenu, est une division en trois niveaux (Dasarathy 1997), celui des données (ou bas niveau), 
celui des caractéristiques (Le. des paramètres extraits) (ou fusion de niveau intermédiaire) et 
celui des décisions (ou fusion de haut niveau). 

Le choix du niveau de fusion doit se faire en fonction des données disponibles et de l'archi- 
tecture de la fusion retenue (centralisée, distribuée, ...) qui sont liées à l'application recherchée. 
Ainsi, nous pouvons chercher à fusionner des informations issues de différents capteurs tels 
que des radars de fréquences différentes afin d'estimer au mieux la réflexion d'une cible. Dans 
ce cas une approche de fusion bas niveau sera préférable. 

Dans ce papier, nous considérons une application dans le cadre de la classification. Plu- 
sieurs classifieurs peuvent fournir une information sur la classe de l'objet observé. Ainsi, nous 
retenons des approches de fusion haut niveau pour résoudre un tel problème. Les données ex- 
primant une décision peuvent être de type numérique (tel que les sorties des classifieurs) ou 
symbolique (tel que les classes décidées par les classifieurs exprimées sous forme de sym- 
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boles). Nous présentons ici une étude comparative des méthodes de fusion haut niveau dans le 
cadre de la classification d'images sonar. 

Les images sonar sont caractérisées par un grand nombre d'imperfections telles que l'incer- 
titude du milieu, les imprécisions des mesures et de reconstruction de l'image. C'est pourquoi, 
nous cherchons ici à extraire des paramètres de textures sur ces images, en considérant que la 
physique du problème a été au mieux prise en compte lors de l'étape de reconstruction. Nous 
retenons quatre jeux de paramètres extraits selon quatre méthodes différentes de traitement 
d'images. Les images sonar sont ensuite classées par quatre perceptrons multicouche, chacun 
considérant un des quatre jeux de paramètres. 

Nous présentons tout d' abord trois grandes classes de méthodes de fusion haut niveau, les 
approches par vote, celles issues de la théorie des possibilités et celles issues de la théorie 
des croyances. Nous exposons ensuite la complexité des images sonar pour leur classification 
automatique, ainsi que les quatre méthodes retenues pour l'extraction de paramètres de texture. 
Enfin nous présentons une évaluation comparative des méthodes de fusion d'informations haut 
niveau selon la configuration retenue pour la classification d'images sonar. 



2 Méthodes de fusion d'informations 

Nous présentons ici trois cadres théoriques de fusion d'informations haut niveau, le prin- 
cipe du vote, la théorie des possibilités et la théorie des croyances. Nous considérons le problème 
de la fusion de m sources Sj afin de déterminer une des n classes d possibles. 



2.1 Principe du vote 

Le principe du vote est la méthode de fusion d'informations la plus simple à mettre en 
œuvre. Plus qu'une approche de fusion, le principe du vote est une méthode de combinaison 
particulièrement adaptée aux décisions de type symbolique. Notons Sj(x) = i le fait que la 
source Sj attribue la classe Cj à l'observation x. Nous supposons ici que les classes Cj sont 
exclusives. A chaque source nous associons la fonction indicatrice : 

M({x) = { l Si S iW =i ' (1) 
1 K ' [0 sinon. 

La combinaison des sources s'écrit par : 



m 

M*{x) = Y,Mi{x), (2) 

pour tout k. L'opérateur de combinaison est donc associatif et commutatif. La règle du vote 
majoritaire consiste à choisir la décision prise par le maximum de sources, c'est-à-dire le maxi- 
mum de . Cependant cette règle simple n'admet pas toujours de solutions dans l'ensemble 
des classes D = {C\, . . . , C n }. En effet, par exemple si le nombre de sources m est paire 
et que m/2 sources décident d x et m/2 autres sources disent C, 2 , ou encore dans le cas où 
chaque source affecte à x une classe différente. Nous sommes donc obligé d'ajouter une classe 
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C n +i qui représente l'incertitude totale liée au conflit des sources sous l'hypothèse de l'ex- 
haustivité des classes C„+i = {Ci, . . . , C n }. La décision finale de l'expert prise par cette 
règle s'écrit donc par : 

f k si max fe Mf(x), 
[ n + 1 sinon. 

Cette règle est cependant peu satisfaisante dans les cas où deux sources donnent le maximum 
pour des classes différentes. La règle la plus employée est la règle du vote majoritaire absolu 
qui s'écrit : 

ffc si maxfeMftx) > f , 
[ n + 1 sinon. 

A partir de cette règle il a été démontré (Lam et Suen 1997) plusieurs résultats prouvant 
que la méthode du vote permet d'obtenir de meilleurs performances que toutes les sources 
prises séparément, sous des hypothèses d'indépendance statistique des sources et de même 
probabilité, et ceci est d'autant plus vrai que m est impaire. 

Il est possible de généraliser le principe du vote majoritaire afin de supprimer le conflit. Au 
lieu de combiner les réponses des sources par une somme simple comme dans l'équation (0, 
l'idée est d'employer une somme pondérée (Xu et al. 1992) : 

m 

M£(x) = J2<*jkMi(x), (5) 



où ajk = 1. Les poids ajk représentent la fiabilité d'une source pour une décision 

j=i fe=i 

donnée, et l'estimation de ces poids peut se faire à partir des taux normalisés de réussite pour 
chaque classe et chaque classifieur. Notons qu'alors nous introduisons une connaissance a 
priori non nécessaire précédemment. Les différentes règles de décision possibles peuvent se 
résumer par la formule suivante : 

= f k si Afjf (x) = maxi Mf(x) >cm + b(x), 
* \ n + 1 sinon, 

où c est une constante de [0, 1] et b(x) est une fonction de M^(x). 



2.2 Théorie des possibilités 

La théorie des possibilités proposée par (Zadeh 1978, Dubois et Prade 1988) permet de 
tenir compte de l'imprécision des données ainsi que de l'incertitude à partir de deux fonctions 
de possibilité et de nécessité. Ces deux fonctions sont obtenues à partir des distributions de 
possibilités définies sur D — {Ci, . . . , C n } par : 

7T : D -> [0,1], sup7r(x) = 1. (7) 

x£D 

Ces distributions donnent le degré d' appartenance au domaine D, qui n' est autre qu' un opérateur 
flou. Afin d'extraire l'imprécision et l'incertitude des données, deux fonctions spécifiques sont 



RNTI - 1 



Fusion de classifieurs pour la classification d'images sonar 



définies à partir de ces distributions. La fonction de possibilité est définie pour tout A e 2 
par : 

II(A) = supTr(ar). (8) 

xeA 

La fonction de nécessité est donnée pour tout A e 2 D par : 

N(A) = 1 - II(A C ), (9) 

où A c représente l'événement contraire de A. 

Un des avantages de la théorie des possibilités est le nombre d'opérateurs de combinaison 
disponibles. Il est ainsi possible de combiner l'information issue des distributions de possibi- 
lité, à partir d'opérateurs de type t-norme, t-conorme, moyenne, sommes symétriques, etc.. 
Le choix du type de combinaison est un problème délicat a priori dans la théorie des possibi- 
lités, et doit être fait selon l'application et l'objectif recherché. Ce choix peut se faire selon le 
comportement général de l'opérateur (conjonctif, disjonctif, ou des compromis), selon les pro- 
priétés désirées, selon sa capacité à discriminer les classes, ou encore selon son comportement 
dans des situations de conflit. En pratique de nombreux opérateurs sont employés et testés dans 
les applications, tels que max (opérateur de type É-norme), min (opérateur de type É-conorme), 
ou la moyenne, la médiane et les intégrales floues (opérateurs de type moyenne). 

La dernière étape de la fusion d'informations est l'étape de décision. Dans le cadre de la 
théorie des possibilités, elle est généralement faite selon la règle suivante : la classe Ck est 
décidée pour l'observation x si : 

C k = argmax^z), (10) 

l<i<n 

où fii(x) représente le coefficient d'appartenance de a; à la classe Cj, qui sera ici donné par les 
sorties du classifieur. 

Par construction des opérateurs de combinaison et de la règle de décision, la théorie des 
possibilités est davantage adaptée à la fusion d'informations de type numérique. Ainsi les 
coefficients d'appartenance peuvent être facilement obtenus dans le cadre de la classification 
par les sorties numériques des classifieurs. Nous emploierons donc ici cette théorie pour la 
fusion d'informations haut niveau sur des données de type numérique. 

2.3 Théorie des croyances 

La théorie des croyances (ou théorie de Dempster-Shafer) permet également de représenter 
à la fois l'imprécision et l'incertitude au travers deux fonctions : la fonction de croyance 
et la fonction de plausibilité (Bloch 2003, Appriou 2002). Ces deux fonctions sont dérivées 
des fonctions de masses. Le principe de la théorie des croyances repose sur la manipulation 
de ces fonctions de masse définies sur des sous-ensembles et non sur des singletons comme 
dans la théorie des probabilités. En effet, elles sont définies sur chaque sous-espace de l'en- 
semble des disjonctions du cadre de discernement D = {Ci, . . . , C n } et à valeurs dans [0, 1]. 
Généralement, il est ajouté une condition donnée par : 

J2m J (A) = l, (11) 

AE2 D 
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où m(.) représente la fonction de masse. Dans cette théorie la première difficulté est le choix 
de la fonction de masse. Plusieurs approches ont été proposées, nous en retenons ici deux : 
l'une fondée sur un modèle probabiliste (Appriou 2002) et l'autre sur une transformation en 
distance (Denœux 1995). 

(Appriou 2002) propose deux modèles répondant à trois axiomes qui impliquent la considération 
de n * m fonctions de masse aux seuls éléments focaux possibles {Ci}, {Cf } et D. Un axiome 
garantit de plus l'équivalence avec l'approche bayésienne dans le cas où la réalité est parfaite- 
ment connue (méthode optimale dans ce cas). Ces deux modèles sont sensiblement équivalents 
sur nos données, nous utilisons dans cet article le modèle donné par : 

"Hj^yiiK^) — i+R jP (Sj/Ci) 

= wimm (12) 

m ij (D)(x) = 1 - atij 

où p est une probabilité, Rj = (maxjj -,p(Sj/Ci))~ est un facteur de normalisation, et G 
[0, 1] est un coefficient d' affaiblissement permettant de tenir compte de la fiabilité d'une source 
Sj pour une classe Ci, que nous choisissons ici égale à 1. 

La difficulté de ce modèle est alors l'estimation des probabilités p(Sj/Ci). Dans le cas où 
la donnée de la source Sj est la réponse d'un classifieur exprimée sous la forme de la classe 
(donnée symbolique), l'estimation de ces probabilités peut être faite par les matrices de confu- 
sion sur une base d'apprentissage. Si la réponse du classifieur est une donnée numérique, l'es- 
timation de telles probabilités peut se faire soit par une approche fondée sur les fréquences, soit 
sous l'hypothèse de la distribution suivie par ces probabilités. Dans ce dernier cas l'estimation 
est généralement plus délicate, nous retiendrons donc ce modèle pour la fusion d'informations 
haut niveau des données symboliques. 

En revanche l'approche fondée sur une transformation en distance proposée par (Denœux 
1995) est plus adaptée à la fusion d'informations haut niveau des données numériques. En 
effet, les fonctions de masse sont définies par : 

m i: j(Ci/x^)(x) = a.jLpi (d(x,x^)) 

mij (D/xW)(x) = l-a im (d(s, zW)) ( ' 

où est un vecteur d'apprentissage des réponses des sources, a, 3 G [0, 1] est un coefficient 
d'affaiblissement, d est une distance à déterminer entre x et x^\ Ci est la classe associée à 
x^\ et ipi est une fonction vérifiant : 

( ¥><(0) = 1, 

\ lim <pi(d) = 0. ( 14 ) 

Il existe un grand nombre de fonctions Lp i vérifiant ces égalités, sans qu'il y ait une méthode 
pour le choix de ces fonctions. Dans le cas d'une distance euclidienne, Denœux propose la 
fonction : 

(Pi(d) =exp( 7î d 2 ), (15) 

où 7i > est un paramètre associé à la classe Cj. 7* peut être initialisé comme l'inverse de la 
distance moyenne entre les vecteurs d'apprentissage vérifiant d. La distance d(x,x^) peut 
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être considérée uniquement pour les fc-plus proches voisins de x afin de réduire le temps de 
calcul. 

La différence de fond avec les modèles d'Appriou est qu'ici il faut estimer une distance 
au lieu d'une probabilité. La distance, généralement euclidienne est plus adaptée aux données 
numériques, tandis que l'estimation des probabilités est ici plus aisée pour des données sym- 
boliques. Dans le cas d'une distance euclidienne, notons que nous obtenons une fonction de 
masse proche de celle obtenue par un modèle d'Appriou sous l'hypothèse d'une distribution 
gaussienne. Nous comparons donc ces deux approches pour la fusion d'informations avec des 
données de type symétrique pour le modèle probabiliste et numérique pour le modèle des dis- 
tances. 

La combinaison des fonctions de masse est fondée sur la règle orthogonale de Dempster- 
Shafer non normalisée proposée par (Smets 1990) définie pour deux fonctions de masse m\ et 
m-i et pour tout A &2 D par : 

m(A) = (m 1 ®m 2 )(A)= ^ mi (B)m 2 (C) . (16) 

BnC=A 

Cette opérateur est associatif et commutatif. La masse affectée sur l'ensemble vide s'interprète 
comme une mesure de conflit. Pour les modèles d'Appriou et de Denœux, nous obtenons donc 
une unique fonction de masse en combinant les fonctions . 

La dernière étape de la fusion est la décision sur la classe la plus vraisemblable. La théorie 
des croyances offrent plusieurs règles de décision fondées sur la maximisation d'un critère. En 
particulier, nous pouvons employer le maximum des fonctions de croyance ou des fonctions 
de plausibilité. Si les premières peuvent être trop pessimistes, les secondes peuvent être trop 
optimistes. Un compromis est le maximum des probabilités pignistiques proposées par (Smets 
1990) qui est le critère retenu dans cet article. 

3 Classification d'images sonar 

La classification des images sonar est un problème difficile en soi. Les méthodes de ca- 
ractérisation automatique consistent en des méthodes d'analyse de texture, les images de fonds 
marins présentant en effet des zones de sédiments homogènes ou non qui peuvent s'apparenter 
à des textures. La littérature concernant les méthodes d'analyse de la texture est abondante et le 
choix de l'une ou de plusieurs d'entre elles dépend très souvent de l'image et de l'application. 
Ces méthodes fournissent généralement un ensemble assez restreint de paramètres pertinents 
qui permettent de classer l'image en un ou plusieurs type de sédiments. Nous exposons ici 
toute la complexité des images sonar due aux nombreuses imperfections, puis nous présentons 
les classifieurs à base de méthodes d'analyse de texture. 

Les images sonar sont obtenues à partir des mesures temporelles faites en traînant à F arrière 
d'un bateau un sonar qui peut être latéral, frontal, ou multifaisceaux. Chaque signal émis est 
réfléchi sur le fond puis reçu sur l'antenne du sonar avec un décalage et une intensité variable. 
Pour la reconstruction sous forme d'images un grand nombre de données physiques (géométrie 
du dispositif, coordonnées du bateau, mouvements du sonar, ...) est pris en compte, mais elles 
sont entachées des bruits de mesures dues à l'instrumentation. A ceci viennent s'ajouter des 
interférences dues à des trajets multiples du signal (sur le fond ou la surface), à des bruits de 
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chatoiement, ou encore à la faune et à la flore. Les images sont donc entachées d'un grand 
nombres d'imperfections telles que l'imprécision et l'incertitude. 

26 images fournies par le GESMA (Groupe d'Etudes Sous-Marine de l'Atlantique) ont 
été obtenues à partir d'un sonar Klein 5400 permettant une bonne résolution. Ces images ont 
été segmentées en imagettes de taille 64 x 64 pixels (voir Tab. [TJ étiquetées selon le type de 
sédiment. Nous avons ainsi distingué le sable (54.52%), la roche (21.35%), les rides de sable 




TAB. 1 -Exemple d'image sonar (fournit par le GESMA) et d'imagettes extraites et étiquetées. 

(8.80%), la vase (5.50%), les cailloutis (0.77%) et l'ombre (2.40%) qui représente l'absence 
d'information sur le type de sédiment. De plus, nous avons indiqué lorsque ces imagettes com- 
prennent plus d'un sédiment (homogènes ou non), ce qui représente 39.70% des imagettes. 
Le type de sédiment de ces imagettes est le plus présent. Notons également que ces bases 
de données sont très délicates à réaliser, car elles sont entachées des erreurs éventuelles de 
l'expert. 

Les classifieurs sont composés chacun d'une méthode d'extraction de paramètres de tex- 
ture et d'un perceptron multicouche. L'approche retenue pour l'architecture de fusion est celle 
présentée sur la Fig. 1 . La fusion d'informations haut niveau se fait donc soit au niveau des sor- 
ties numériques des perceptrons soit au niveau des sorties symboliques représentant les classes 
affectées. 
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Les méthodes d'extraction de paramètres de texture sont celles déjà présentées dans (Mar- 
tin et al. 2004). Chaque méthode permet de calculer des paramètres différents, parfois redon- 
dants entre eux, mais avec des caractéristiques propres à la méthode. 

Les matrices de co-occurrence sont calculées en comptant les occurrences identiques de 
niveaux de gris entre deux pixels contigus. Quatre directions sont considérées : 0, 45, 90 et 135 
degrés. Dans ces quatre directions six paramètres d'Haralick sont calculés : l'homogénéité, 
le contraste, l'entropie, la corrélation et l'uniformité. Un des problèmes principaux de cette 
approche est la non invariance en translation. Ainsi les imagettes de rides auront des paramètres 
différents selon la direction de celles-ci. 

Les matrices de longueurs de plages sont obtenues en comptabilisant les pixels consécutifs 
possédant le même niveau de gris dans les quatre directions précédemment considérées. Dans 
chacune des directions cinq paramètres sont calculés : la proportion de petite longueur de plage, 
la dispersion des plages entre les niveaux de gris et entre les longueurs et le pourcentage des 
longueurs de plage. Cette approche est bien adaptée aux images optiques faiblement bruitées. 
Dans le cas des images sonar, où un bruit de chatoiement est fortement présent, il faudrait 
soit supprimer ce bruit soit adapter le calcul des paramètres. Nous conservons cependant cette 
approche afin d'évaluer la robustesse de la fusion aux mauvais paramètres de texture. 

La troisième approche retenue est une transformée en ondelettes. Les deux approches 
précédentes ne permettent pas de tenir compte de l'invariance dans les directions. La trans- 
formée en ondelettes discrète invariante en translation est fondée sur le choix de la transforma- 
tion optimale pour chaque niveau de décomposition. Chaque niveau de décomposition fournit 
quatre images, sur lesquelles nous calculons trois paramètres : l'énergie, l'entropie, et une 
moyenne. Nous retenons un niveau de décomposition de trois ce qui fournit 63 paramètres au 
classifieur. 

Enfin, une approche fondée sur les filtres de Gabor permet de résoudre le problème des 
rides. En effet, nous considérons cinq fréquences différentes pour six directions ce qui donne 
trente filtres. Sur ces filtres, nous calculons quatre paramètres statistiques : le maximum de 
F écart-type d'un sédiment considéré, la moyenne de tous les filtres, la moyenne dans la direc- 
tion horizontale (celle des pings du sonar) et l'écart-type avant filtrage. 

Ces quatre jeux de paramètres sont ensuite considérés indépendamment à l'entrée de quatre 
perceptrons multicouche ayant ainsi des couches d'entrée de 24, 63, 20 et 4 neurones et une 
couche de sortie de 6 neurones correspondant aux six classes de sédiments considérés. L'ap- 
prentissage est réalisé pour une fonction sigmoïde de sortie donnant ainsi pour chacun des 
neurones k de la couche de sortie une valeur réelle Ok G [0, 1]. Ces valeurs Ok constituent 
les données numériques sur la décision des classifieurs. Les décisions symboliques sont obte- 
nues en considérant pour chaque classifieur le maximum des Ok, indiquant ainsi la classe Ck 
préférée par chaque perception. 

4 Résultats 

La base de données a été divisée aléatoirement en trois parties égales. La première sert à 
l'apprentissage des perceptrons multicouche, la deuxième à l'apprentissage de la fusion et la 
troisième pour les tests. Afin d'accroître la qualité de l'estimation des taux de classification, 
nous avons répété le tirage aléatoire 10 fois et moyenné les résultats. Dans l'approche par vote 
majoritaire nous avons obtenu un conflit de 18.59%, afin de supprimer ce conflit nous avons 
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Coocc. 


longueur 
de plages 


ondel. 


Gabor 


PMC 


vote 


poss. 


croyances 


proba. 


distance 


70.0 


50.3 


68.9 


66.4 


50.0 


62.0 


69.9 


68.8 


79.5 



Tab. 2 - Taux de classification avant et après fusion d'informations (%). 



roche 


87.3 


sable 


84.9 


ride 


61.3 


vase 


4.9 


cailloutis 


0.9 


ombre 


71.5 


homogènes 


91.3 


non homogènes 


63.1 



Tab. 3 - taux de classification par type de sédiment pour le modèle de distance (%). 

considéré l'approche avec les pondérations ctjk estimées par les matrices de confusion. Dans 
le cadre de la théorie des possibilités de nombreux opérateurs de combinaison ont été testés ; 
nous présentons ici celui donnant les résultats les plus probants donnés par l'opérateur max 
(i-conorme). 

Le Tab. 2 présente les taux de bonne classification définis par le rapport du nombre d'ima- 
gettes bien classées sur le nombre total d'imagettes de la base de test. Nous constatons que 
les quatre méthodes de fusion présentées sont plus robustes aux données erronées fournies par 
les longueurs de plages que le PMC (perception global prenant en entrée l'ensemble des pa- 
ramètres extraits). Cependant la fusion par vote reste moins bonne que les trois classifieurs 
issus des matrices de co-occurence, ondelettes et Gabor, les hypothèses de (Lam et Suen 1997) 
ne sont pas vérifiées. Les deux approches de fusion d'informations haut niveau à partir des 
données numériques sont plus performantes que les approches à partir des données symbo- 
liques. Notons de plus que la théorie des croyances avec le modèle de distance donne signifi- 
cative ment les meilleurs résultats que nous détaillons dans le Tab. 3. Les meilleurs taux sont 
atteints pour les sédiments sable et roche, ceci est dû à l'apprentissage du perception qui est 
meilleur pour les sédiments les plus représentés numériquement. Les cailloutis et la vase offrent 
de mauvais résultats car leur effectif est faible dans la base. Notons encore que les taux pour 
les imagettes homogènes sont bien meilleurs, mais est-il raisonnable de chercher à affecter un 
type de sédiment à une imagette qui en contient plusieurs. Ceci doit entraîner une remise en 
cause de la constitution même de la base de données. 

5 Conclusion 

Nous avons étudié les différentes approches de fusion d'informations haut niveau, en fai- 
sant ressortir leurs avantages et inconvénients, et notamment la facilité pour chacune d'entre 
elles à être employées pour des données numériques et symboliques. Ces approches ont été 
comparées dans le cadre d'une application particulièrement délicate : la classification d'images 
sonar. En effet, nous avons vu la complexité pour l'expert à interpréter ces images, et la diffi- 
culté de les classer automatiquement. La fusion d'informations apporte une solution intéressante 
pour la résolution de tels problèmes particulièrement grâce à sa facilité de mise en œuvre 
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pour des applications de classification. Nous avons ici fait ressortir de meilleures perfor- 
mances pour la fusion d'informations haut niveau à partir de données numériques et plus par- 
ticulièrement dans le cadre de la théorie des croyances. Cependant, nous devons bien nous 
garder de généraliser de tels résultats à tout type de données. 

Pour cette application nous avons fait ressortir l'influence du sur-apprentissage du percep- 
tion employé qui provient de la différence d'effectifs des sédiments dans la base de données. 
La gestion des événements rares peut être réalisée par la fusion, mais dans ce cas avant le 
classifieur. Une fusion d'informations bas niveau doit alors être envisagée. Une autre difficulté 
est issue de la constitution même de la base. Le fait d'avoir des imagettes possédant plusieurs 
sédiments augmente l'incertitude, qui est dans ce cas dure à mesurer. Nous travaillons sur la 
réalisation d'une base de zones homogènes où l'incertitude sera mesurable plus finement. 
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Summary 

In this paper, we présent some high level information fusion approaches for numeric and 
symbolic data. We study the interest of such method particularly for classifier fusion. A com- 
parative study is made in a context of sea bed characterization from sonar images. The classi- 
fication of kind of sédiment is a difficult problem because of the data complexity. We compare 
high level information fusion and give the obtained performance. 
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Différentes actions 



Sélection, transformation (fouille de données) 

Extraction d'informations, estimation 
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FUSION de données, de caractéristiques, de décisions 



